Entre AWS et Hugging Face, les arbitrages LLM d'eTF1 | Silicon

La Rédaction - Silicon - 09/07
Hugging Face est en bonne position dans la toolbox LLM d'eTF1, qui déploie à la fois sur du GPU NVIDIA et sur des puces Inferentia.

Plutôt TGI ou vLLM ? Chez eTF1, on a opté pour le premier de ces serveurs d’inférence, qui « répond [aux] besoins actuels ». On garde toutefois un œil sur le second, dans l’optique de montées en charge.

Les déploiements de LLM se fo...
[Courte citation de 8% de l'article original]

Loading...